#planificación de alto nivel

Reutilización de conocimiento en meta-aprendizaje por refuerzo

Marco de meta-RL reutiliza conocimiento entre agentes heterogéneos: reduce errores de seguimiento hasta un 99.79% con solo 23.8% de datos.